
Entrenamiento temprano en Meta AI sin recompensas para agentes de lenguaje—y supera el aprendizaje por imitación
Aprendizaje temprano sin recompensas para agentes de lenguaje en Meta AI supera al aprendizaje por imitación, mostrando resultados sorprendentes que podrían revolucionar el campo.